中国有两个香菇种群:香菇和未挖掘的形态学物种,分别命名为A和B。已有研究发现这两个种群的核基因类型不同,根据其ITS2序列,香菇(ITS2-A)包含两个分支(ITS2-A1和ITS2-A2),未挖掘的形态学物种(ITS2-B)也包含两个分支(ITS2-B1和ITS2-B2)。
凌恩生物合作客户于《Scientific Reports》(IF=4.011)杂志发表最新关于中国两种香菇线粒体基因组类型研究。
由于ITS2序列位于核基因组中,那么具有不同ITS2类型的两个香菇种群否属于相同还是不同的线粒体基因组类型(mt)?本文选择了20种具有不同ITS2类型的香菇菌株进行重测序研究(下表)。具体研究内容如下:1)对L135菌株完整线粒体基因组进行测序,作为参考基因组;2)通过对19种ITS2类型不同的菌株线粒体基因组进行重新测序,研究了中国两个香菇种群的线粒体基因组类型;3)研究不同线粒体基因组类型之间的SNP和插入缺失多样性;4)对不同于L135类型的YAASM363菌株完整线粒体基因组进行测序,筛选合适的标记物以鉴定不同的线粒体基因组类型。
L135的线粒体基因组是一个环状DNA分子,大小为119,134 bp,GC含量为30.77%。基因组注释到15个保守的蛋白质编码基因,2个rRNA基因,26个tRNA基因,30个假定蛋白(10个在4个保守蛋白质编码基因的内含子中,4个在2个rRNA基因的内含子中以及16个在基因间区中)和3个其他功能组成(下图a)。基因功能如下表所示。YAASM363线粒体基因组的总长度和GC含量分别为115,116 bp和31.76%(下图b),包含15个保守的蛋白质编码基因,2个rRNA基因,26个tRNA基因,22个假定蛋白(10个在4个保守蛋白质编码基因的内含子中,3个在1个rRNA基因的内含子中和9个在基因间区中)和2个其他特征。 图1. L135(a)和YAASM363(b)的线粒体基因组图谱。蛋白编码基因(酒红色),rRNA基因(绿色),tRNA基因(瓶绿色),其他特征(灰色),内含子(虚线),假定蛋白(orf +数字)。
2、ITS2类型不同的20个菌株的线粒体基因组类型研究中的20个菌株具有38个ITS序列,通过NJ法构建系统进化树发现,38个ITS2序列分为两个谱系:ITS2-A和ITS2-B。每个谱系又细分为2个分支(ITS2-A1和ITS2-A2,ITS2-B1和ITS2-B2)(下图a)。基于L135的线粒体基因组,对其余19个菌株进行了重测序,并组装了它们的线粒体基因组。与参考基因组比对,共鉴定出12,321个SNP和2,272个插入缺失。NJ树显示20个菌株的线粒体基因组属于两个不同的谱系mt-A和mt-B。mt-A细分为两个分支mt-A1和mt-A2(下图b)。主成分分析(PCA)(下图c)和种群结构分析(下图d)证明了NJ树的结果。其中3个菌株(YAASM298,YAAASM301和YAAASM2323)是mt-A和mt-B之间的重组线粒体基因组类型。因为它们的大多数SNP属于mt-B,所以这3个菌株都包含在mt-B中。图2. ITS2和20个菌株的线粒体基因组的群体分析。(a)使用ITS2数据构建NJ树。每个菌株的不同ITS2序列分别标记为c1,c2,c3和c4。(b)使用SNP数据构建NJ树。(c)PCA分析。(d)群体结构分析,群体A:紫色;群体B:蓝色。
3、mt-A1、mt-A2和mt-B之间的SNP和indel多样性通过测试mt-A1、mt-A2和mt-B之间SNP和indel的差异显著,mt-B中的SNP和indel数量明显高于mt-A1和mt-A2。mt-A2中的插入缺失的数量明显高于mt-A1。mt-B中同义和非同义突变的数量与mt-A1和mt-A2的相同。mt-A1和mt-A2之间的存在40个不同SNP(图3a),基因间区域中有36个SNP,cox1(orf202和orf190)的2个内含假设蛋白编码基因中有2个SNP,rrnS中有1个SNP。mt-A和mt-B之间的304个不同SNP(图3b)。 图3.不同线粒体基因组类型之间的SNP。(a)mt-A1和mt-A2之间的SNP。(b)mt-A和mt-B之间的SNP。位点(红色):CDS中的非同义SNP;位点(绿色):CDS中的同义SNP;位点(黄色):CDS中的终止子缺失SNP。
4、用于识别mt-A1, mt-A2和mt-B的标记基因 为了筛选鉴定mt-A1,mt-A2和mt-B的标记,研究测序了mt-B中完整的YAASM363线粒体基因组,并与NCBI香菇线粒体参考基因组(NC_018365.1和KY217797.1)用于系统发育和共线性分析(图4)。NC_018365.1与L135在基因数量和排列方式上具有良好的一致性,属于mt-A1。KY217797.1的线粒体基因组属于mt-A2。对这四个线粒体基因组的15个编码蛋白基因和2个rRNA基因比对(图4a)。基因atp6, atp8, atp9, cox2, nad4L和nad6相同。基因cob, cox3, nad2, nad3, nad4, nad5, rps3和rrnS在mt-B和mt-A的两个分支之间不同,而在mt-A1和mt-A2之间只有很小的差异。可用作识别mt-A和mt-B的标记基因。四个线粒体基因组的cox1, nad1和rrnL基因都完全不同,可以用作鉴定mt-A1,mt-A2和mt-B的标记基因。 图4. L135,NC_018365.1,KY217797.1和YAASM363之间完整的线粒体基因组NJ进化树(a)和共线性分析(b)。
本文基于Illumina(450 bp)和PacBio(8-10 kb)测序数据组装了L135和YAASM363的完整线粒体基因组。并对19个香菇线粒体基因组重测序,用于分析两个香菇种群的遗传多样性和结构。这表明在这两个种群之间可能需要频繁的遗传交换,核基因和线粒体标记都必须用于香菇菌株的鉴定。此外,SNP多样性分析表明可使用cob, cox3, nad2, nad3, nad4, nad5, rps3和rrnS基因鉴定mt-A和mt-B,并且cox1, nad1和rrnL基因可用于识别mt-A1,mt-A2和mt-B。本文对于研究中国香菇种群分布和分型具有重要意义。
Mitogenome types of two Lentinula edodes sensu lato populations in China. Scientific Reports, 2019.
凌恩生物成立于2014年,专注组学技术在科研领域的应用与研究。公司成立以来,技术团队参与的项目成果成功发表在《Nature》《Cell》《PNAS》等国际顶端学术期刊。
秉承“以客户需求为本,为客户创造价值”的服务宗旨;以高品质、高效率的技术服务,用心打造凌恩品牌,助力您的成功!